智能论文笔记

Learning to correct spectral methods for simulating turbulent flows

Gideon Dresdner , Dmitrii Kochkov , Peter Norgaard , Leonardo Zepeda-Núñez , Jamie A. Smith , Michael P. Brenner , Stephan Hoyer

分类：机器学习

2022-07-01

尽管在整个科学和工程中都无处不在，但只有少数部分微分方程（PDE）具有分析或封闭形式的解决方案。这激发了有关PDE的数值模拟的大量经典工作，最近，对数据驱动技术的研究旋转了机器学习（ML）。最近的一项工作表明，与机器学习的经典数值技术的混合体可以对任何一种方法提供重大改进。在这项工作中，我们表明，在纳入基于物理学的先验时，数值方案的选择至关重要。我们以基于傅立叶的光谱方法为基础，这些光谱方法比其他数值方案要高得多，以模拟使用平滑且周期性解决方案的PDE。具体而言，我们为流体动力学的三个模型PDE开发了ML增强的光谱求解器，从而提高了标准光谱求解器在相同分辨率下的准确性。我们还展示了一些关键设计原则，用于将机器学习和用于解决PDE的数值方法结合使用。

translated by 谷歌翻译

Stochastic Frank-Wolfe for Constrained Finite-Sum Minimization

Geoffrey Négiar , Gideon Dresdner , Alicia Tsai , Laurent El Ghaoui , Francesco Locatello , Robert M. Freund , Fabian Pedregosa

分类：机器学习

2020-02-27

我们提出了一种新颖的随机弗兰克 - 沃尔夫（又名条件梯度）算法，用于使用广义的线性预测/结构进行约束的平滑有限和最小化。这类问题包括稀疏，低级别或其他结构化约束的经验风险最小化。提出的方法易于实现，不需要阶梯尺寸调整，并且具有独立于数据集大小的恒定触电成本。此外，作为该方法的副产品，我们获得了Frank-Wolfe间隙的随机估计器，可以用作停止标准。根据设置，提出的方法匹配或改进了随机Frank-Wolfe算法的最佳计算保证。几个数据集上的基准强调了不同的策略，其中所提出的方法比相关方法表现出更快的经验收敛性。最后，我们在开源软件包中提供了所有考虑的方法的实现。

translated by 谷歌翻译

FormLM: Recommending Creation Ideas for Online Forms by Modelling Semantic and Structural Information

Yijia Shao , Mengyu Zhou , Yifan Zhong , Tao Wu , Hongwei Han , Shi Han , Gideon Huang , Dongmei Zhang

分类：自然语言处理

2022-11-10

Online forms are widely used to collect data from human and have a multi-billion market. Many software products provide online services for creating semi-structured forms where questions and descriptions are organized by pre-defined structures. However, the design and creation process of forms is still tedious and requires expert knowledge. To assist form designers, in this work we present FormLM to model online forms (by enhancing pre-trained language model with form structural information) and recommend form creation ideas (including question / options recommendations and block type suggestion). For model training and evaluation, we collect the first public online form dataset with 62K online forms. Experiment results show that FormLM significantly outperforms general-purpose language models on all tasks, with an improvement by 4.71 on Question Recommendation and 10.6 on Block Type Suggestion in terms of ROUGE-1 and Macro-F1, respectively.

translated by 谷歌翻译

Deep learning in a bilateral brain with hemispheric specialization

Chandramouli Rajagopalan , David Rawlinson , Elkhonon Goldberg , Gideon Kowadlo

分类：人工智能 | 机器学习 | 神经与进化计算

2022-09-09

地球上所有双侧对称动物的大脑被分为左右半球。半球的解剖学和功能具有很大程度的重叠，但它们专门具有不同的属性。据信左半球专门研究特殊性和常规，右边是一般性和新颖性。在这项研究中，我们提出了一个人工神经网络，该网络模仿具有不同训练目标的两个卷积神经网络，并在图像分类任务上对其进行测试。双边体系结构的表现优于类似代表能力的体系结构，这些体系结构不利用差异化专业化。它证明了双边主义的功效，并构成了一个新原则，可以将其纳入其他计算神经科学模型中，并在设计新的ML系统时用作归纳偏见。对模型的分析可以帮助我们理解人脑。

translated by 谷歌翻译

Continual few-shot learning with Hippocampal-inspired replay

Gideon Kowadlo , Abdelrahman Ahmed , Amir Mayan , David Rawlinson

分类：神经与进化计算 | 机器学习

2022-08-26

持续学习和少数学习是追求改善机器学习的重要领域。每个边界的工作越来越多，但将两者结合起来很少。但是最近，Antoniou等人。 ARXIV：2004.11967引入了一个连续的少数学习框架CFSL，将两者都结合在一起。在这项研究中，我们扩展了CFSL，以使其与标准持续学习实验更具可比性，通常会介绍更多的类。我们还引入了一个“实例测试”以对非常相似的特定实例进行分类 - ML通常忽略的动物认知能力。我们从原始CFSL工作中选择了代表性的基线模型，并将其与具有海马启发性重播的模型进行了比较，因为海马被认为对动物中的这种学习至关重要。正如预期的那样，学习更多的课程比原始的CFSL实验更加困难，有趣的是，它们的呈现方式对性能有所不同。实例测试中的准确性与分类任务相当。使用重播进行合并可改善两种类型的任务的性能，尤其是实例测试。

translated by 谷歌翻译

Towards Automated Sample Collection and Return in Extreme Underwater Environments

Gideon Billings , Matthew Walter , Oscar Pizarro , Matthew Johnson-Roberson , Richard Camilli

分类：机器人

2021-12-30

在本报告中，我们提出了在哥斯达黎加太平洋架子和圣托里尼 - Kolumbo Caldera Complex中，在寻找寿命中的寻找寿命任务中的自主海洋机器人技术协调，操作策略和结果。它作为可能存在于海洋超越地球的环境中的类似物。本报告侧重于ROV操纵器操作的自动化，用于从海底获取有针对性的生物样品收集和返回的。在未来的外星勘查任务到海洋世界的背景下，ROV是一个模拟的行星着陆器，必须能够有能力的高水平自主权。我们的田间试验涉及两个水下车辆，冰（Nui）杂交ROV的两个水下车辆（即，龙眼或自主）任务，都配备了7-DOF液压机械手。我们描述了一种适应性，硬件无关的计算机视觉架构，可实现高级自动化操作。 Vision系统提供了对工作空间的3D理解，以便在复杂的非结构化环境中通知操纵器运动计划。我们展示了视觉系统和控制框架通过越来越具有挑战性的环境中的现场试验的有效性，包括来自活性Undersea火山，Kolumbo内的自动收集和生物样品的回报。根据我们在该领域的经验，我们讨论了我们的系统的表现，并确定了未来研究的有希望的指示。

translated by 谷歌翻译

Hybrid Visual SLAM for Underwater Vehicle Manipulator Systems

Gideon Billings , Richard Camilli , Matthew Johnson-Roberson

分类：机器人

2021-12-07

本文介绍了一种用于水下车辆机械手系统（UVMS）的新型视野映射方法，具有特定强调自然海底环境中的鲁棒映射。水下场景映射的先前方法通常会离线处理数据，而实时运行的现有水下SLAM方法通常会集中在本地化上而不是映射。我们的方法使用GPU加速SIFT功能在图形优化框架中构建一个特征映射。地图刻度由车辆安装的立体声相机的特征约束，我们通过将机械手系统的动态定位能力从手腕安装的Fisheye摄像机融合到地图中，以将其延伸到车辆安装摄像机的有限视点之外。我们的混合SLAM方法是在Costa rican Continental Shelf级别的自然深海环境中采用UVMS收集的挑战性图像序列，我们还在浅礁调查数据集中评估立体声的立体声。这些数据集的结果证明了我们的系统的高准确性，适合于在不同的自然海底环境中运营。

translated by 谷歌翻译

The Way to my Heart is through Contrastive Learning: Remote Photoplethysmography from Unlabelled Video

John Gideon , Simon Stent

分类：计算机视觉

2021-11-18

能够可靠地估计来自视频的生理信号是低成本，临床前健康监测的强大工具。在这项工作中，我们提出了一种新的远程光学仪器描绘（RPPG）的新方法 - 从人脸或皮肤的观察结果测量血液体积的变化。类似于RPPG的当前最先进的方法，我们应用神经网络，以便在滋扰图像变异的不变性中学习深度表示。与此类方法相比，我们采用了一个完全自我监督的培训方法，这毫无依赖于昂贵的地面真理生理培训数据。我们所提出的方法在频率和时间光滑的频率和兴趣信号的时间平滑之前使用对比学习。我们在四个RPPG数据集中评估我们的方法，显示与最近监督的深度学习方法相比，可以实现可比或更好的结果，但不使用任何注释。此外，我们还将学习的显着重采样模块纳入了我们无监督的方法和监督基线。我们表明，通过允许模型来了解输入图像的位置，我们可以减少手工工程功能的需要，同时为模型的行为和可能的故障模式提供一些可解释性。我们释放守则以获得我们完整的培训和评估管道，以鼓励在这种激动人心的新方向上的可重复进展。

translated by 谷歌翻译

Flood forecasting with machine learning models in an operational framework

Sella Nevo , Efrat Morin , Adi Gerzi Rosenthal , Asher Metzger , Chen Barshai , Dana Weitzner , Dafi Voloshin , Frederik Kratzert , Gal Elidan , Gideon Dror

分类：机器学习

2021-11-04

谷歌的运营洪水预测系统是制定的，为机构和公众提供准确的实时洪水警告，重点是河流洪水在大型潮流的河流中。它在2018年开始运作，自从地理位置扩展以来。该预测系统由四个子系统组成：数据验证，阶段预测，淹没建模和警报分配。机器学习用于两个子系统。阶段预测采用长短期内存（LSTM）网络和线性模型进行建模。使用阈值和歧管模型计算洪水淹没，前者计算淹没程度，后者计算淹没程度和深度。本文首次提供的歧管模型提供了一种机器学习替代洪水淹没的液压建模。在评估历史数据时，所有型号都可以实现可操作使用的足够高的度量指标。 LSTM表现出比线性模型更高的技能，而阈值和歧管模型达到了类似的性能度量，以便在淹没程度上进行建模。在2021年的季风季节期间，洪水预警系统在印度和孟加拉国运营，覆盖河流的洪水区，总面积287,000平方公里，拥有350多万人。超过100米的洪水警报被发送给受影响的人口，相关当局以及紧急组织。系统上的当前和未来的工作包括将覆盖范围扩展到额外的洪水易发位置，以及提高建模能力和准确性。

translated by 谷歌翻译

Active learning for reducing labeling effort in text classification tasks

Pieter Floris Jacobs , Gideon Maillette de Buy Wenniger , Marco Wiering , Lambert Schomaker

分类：自然语言处理 | 机器学习

2021-09-10

标记数据可以是昂贵的任务，因为它通常由域专家手动执行。对于深度学习而言，这是繁琐的，因为它取决于大型标记的数据集。主动学习（AL）是一种范式，旨在通过仅使用二手车型认为最具信息丰富的数据来减少标签努力。在文本分类设置中，在AL上完成了很少的研究，旁边没有涉及最近的最先进的自然语言处理（NLP）模型。在这里，我们介绍了一个实证研究，可以将基于不确定性的基于不确定性的算法与Bert $ _ {base} $相比，作为使用的分类器。我们评估两个NLP分类数据集的算法：斯坦福情绪树木银行和kvk-Front页面。此外，我们探讨了旨在解决不确定性的al的预定问题的启发式;即，它是不可规范的，并且易于选择异常值。此外，我们探讨了查询池大小对al的性能的影响。虽然发现，AL的拟议启发式没有提高AL的表现;我们的结果表明，使用BERT $ _ {Base} $概率使用不确定性的AL。随着查询池大小变大，性能的这种差异可以减少。

translated by 谷歌翻译